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摘要 经 过 20 余 年 的 实践 ， 我 国 已 基本 建立 起 财政 绩效 评价 的 制度 与 方法 体系 。 综 合 打分 制 方法 是 我 国 财政 
绩效 评价 中 普遍 采用 的 方法 ， 该 方法 以 其 标准 化 、 延 明 化 、 简 单 易 行 等 特点 在 快速 推广 财政 绩效 评价 中 发 挥 
了 重要 的 作用 。 然 而 ， 综 合 打 分 制 方法 使 得 多 维 绩效 混合 评价 、 过 于 注重 过 程 评价 、 难 以 准确 反映 评价 对 象 
绩效 实质 等 问题 日 益 凸 显 ， 且 在 科技 领域 的 应 用 面临 更 大 的 挑战 。 为 此 ， 文 章 重点 分 析 了 财政 绩效 评价 综合 
打分 方法 的 问题 与 挑战 ， 基 于 新 时 代 国 家 全 面 预算 绩效 管理 的 要 求 及 相关 国际 实践 ， 提 出 改革 综合 打分 制 方 
法 的 思路 。 
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2018 年 ，《 中 共 中 央 国务 院 关 于 全 面 实 施 预算 。 综合 打分 制 方法 以 其 标准 化 、 透 明 化 、 简 单 易 行 等 特 
绩效 管理 的 意见 》 要 求 政府 管理 部 门 和 有 关 执 行 部 门 。 点 在 绩效 管理 推广 初期 起 到 了 重要 作用 。 但 是 ， 随 着 
必须 树立 “人 花 钱 必 问 效 、 无 效 必 问 责 ” 的 绩效 管理 理 。 实践 的 推进 ,综合 打 分 制 方法 难以 准确 反映 绩效 实质 
念 ， 强 调 财政 投入 的 有 效 性 和 投入 产 出 的 绩效 观 ， 这 ”的 问题 也 日 益 凸 显 。 那 么 ， 应 如 何 认 识 财 政绩 效 评价 
标志 着 我 国 进 入 了 绩效 管理 的 新 时 代 。 绩 效 评 价 是 绩 综合 打分 制 方法 的 问题 与 挑战 ?如 何 改进 或 替代 综合 
效 管理 的 核心 环节 ， 如 何 科 学 地 开展 财政 绩效 评价 ， 打分 制 绩效 评价 方法 ， 以 满足 新 时 代 全 面 预算 绩效 管 
成 为 新 时 代 绩 效 管理 面临 的 首要 问题 。 财 政绩 效 评价 。” 理 的 需求 ? 本 文 从 财政 绩效 评价 综合 打分 制 方法 的 概 
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念 与 应 用 出 发 ， 分 析 提 出 综合 打分 制 方法 面临 的 问题 
与 挑战 ， 结 合 国内 外 的 探索 与 实践 ， 提 出 相关 改革 思 
路 。 


1 财政 绩效 评价 综合 打分 制 方法 的 概念 及 其 
在 我 国 的 应 用 


1.1 财政 绩效 评价 综合 打分 制 方法 的 概念 与 内 涵 

综合 打分 制 绩效 评价 方法 来 源 于 统计 学 中 的 综 
合 评分 法 ， 其 核心 是 根据 评价 对 象 的 不 同等 级 赋予 
不 同 的 分 值 ， 并 以 此 为 基础 进行 综合 评价 "。 该 方 
法 适用 于 评价 指标 无 法 使 用 统一 的 量 纲 进行 定量 分 
析 的 场合 ， 而 以 无 量 纲 的 分 数 进 行 综合 评价 。 该 方 
法 广泛 应 用 于 政府 采购 评 标 、 专 业 技 术 人 员 职 称 考 
核 等 场合 。 财 政绩 效 评价 实践 中 的 综合 打分 制 绩效 
评价 方法 ， 将 多 维 绩效 整合 于 单一 的 指标 化 的 方法 
体系 中 ， 采 用 逐 项 打分 的 方法 评价 多 维 绩效 目标 的 
完成 情况 ， 并 将 多 维 绩效 得 分 加 总 ， 形 成 定量 的 绩 
效 评价 结果 ， 最 终 以 分 数 或 分 档 的 形式 体现 。 综 合 
打分 制 绩效 评价 的 过 程 一 般 分 为 4 个 步 又: @ 根据 
收集 、 整 理 的 证 据 和 设 定 的 打分 标准 ， 对 各 项 评价 
指标 进行 百分制 打分 ; @ 对 每 个 评价 维度 的 各 项 指 
标 得 分 进行 加 权 平 均 ， 算 出 每 个 评价 维度 的 加 权 得 
分 ; @ 根据 每 个 评价 维度 的 得 分 和 权重 ,算出 评价 
对 象 的 总 体 得 分 ; @ 根据 总 分 及 分 档 设 置 标准 ， 确 
定 受 评 对 象 的 绩效 等 级 中 。 

以 财政 部 2020 年 印发 的 《项 目 支 出 绩效 评价 管 
理 办 法 》 为 例 ， 绩 效 评价 包括 单位 自 评 、 部 门 评价 
和 财政 评价 3 种 方式 。 单 位 自 评 指标 既 包 括 表征 项 目 
经 费 管理 绩效 的 预算 执行 率 ， 也 包括 表征 项 目的 产 
出 、 效 益 、 满 意 度 等 绩效 指标 ， 单 位 自 评 指标 的 权重 
原则 上 是 统一 设 定 的 ， 分 为 预算 执行 率 10%、 产 出 指 
标 50%、 效 益 指 标 30%、 服 务 对 象 满意 度 指 标 10%; 
单位 自 评 采用 定量 与 定性 评价 相 结合 的 比较 法 ， 根 据 
标 完 成 值 与 指标 设 定 值 的 比例 程度 记分 。 部 门 和 财 
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政绩 效 评价 指标 包括 能 全 面 反 映 项 目 决策 、 项 目 和 资 
金管 理 、 产 出 和 效益 的 指标 ， 各 项 指标 的 权重 可 体现 
差异 性 ， 但 原则 上 产 出 、 效 益 指标 权重 不 低 于 60%; 
部 门 评价 和 财政 评价 主要 利用 成 本 效益 分 析 法 、 比 较 
法 、 因 素 分 析 法 等 ， 对 指标 进行 打分 。 部 门 和 财政 绩 
效 评价 结果 采取 评分 和 评级 相 结合 的 方式 ， 通 过 单项 
打分 、 累 计 加 总 的 形式 得 出 绩效 评价 的 分 数 结 
进而 进行 分 档 。 一 般 将 总 分 设置 为 100 分 ， 等 级 划分 
为 4 档 : 90 ( 含 ) 一 100 分 为 “ 优 ”、80 ( 含 ) 一 90 
分 为 “ 良 ”、60 ( 含 ) 一 80 分 为 “中 ”、60 分 以 下 为 
eg 
1.2 综合 打分 制 在 我 国 财政 绩效 评价 中 的 应 用 
综合 打分 制 方法 贯穿 于 我 国 财政 绩效 评价 的 各 个 
阶段 ， 广 泛 存在 于 农业 、 教 育 、 科 技 等 各 个 领域 。 我 
国 财政 绩效 评价 大 致 可 划分 为 试点 探索 、 全 面 推进 、 
提 质 增 效 3 个 阶段 。 试 点 探索 阶段 自 2000 年 财政 部 
成 立 预算 编制 改革 领导 小 组 开始 拉 开 了 财政 绩效 评价 
的 序幕 。2001 年 ， 湖 北 省 财政 厅 根 据 财 政 部 的 统一 
部 署 ， 率 先 在 恩施 州 选择 了 “财政 支 农 ”“ 农 业 综 合 
开发 ”等 5 个 项 目 开 展 财政 支出 绩效 评价 试点 工作 。 
此 次 实践 形成 了 一 套 财 政 支 出 绩效 评价 的 指标 体系 和 
评价 流程 ， 并 通过 对 各 级 各 项 指标 进行 打分 呈现 出 最 
终 的 评价 结果 中 。 全 面 推 进 阶段 开始 于 2003 年 ， 党 的 
十 六 届 三 中 全 会 通过 了 《中 共 中 央 关 于 完善 社会 主义 
市 场 经 济 体制 若干 问题 的 决定 》 明 确 提出 “建立 预算 
绩效 评价 体系 ”， 财 政 部 以 此 为 契机 ， 在 规范 管理 化 
绩效 评价 的 同时 ， 将 试点 范围 逐步 向 中 央 和 地 方 全 面 
铺 开 ， 评 价 对 象 也 逐步 实现 向 部 门 和 项 目 全 履 盖 ， 试 
点 领域 逐步 扩展 至 教育 、 社 保 、 科 技 、 农 业 等 领域 。 
相 比 试点 探索 阶段 ， 此 阶段 在 评价 流程 和 评价 体系 上 
更 为 规范 化 、 制 度 化 ， 在 评价 方法 上 更 加 依赖 并 成 熟 
使 用 综合 打分 制 。 提 质 增 效 阶段 伴随 着 全 面 预算 绩效 
管理 的 提出 而 到 来 ，2011 年 ， 财 政 部 在 第 一 次 全 国 预 
算 绩效 管理 工作 会 议 上 首次 提出 了 全 过 程 预 算 绩效 管 
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理 的 理念 "， 并 在 之 后 的 几 年 内 相继 发 文 ， 不 断 完善 
财政 绩效 评价 顶层 设计 。 到 2018 年 ，《 中 共 中 央 、 
国务 院 关 于 全 面 实施 预算 绩效 管理 的 意见 》 的 出 台 将 
预算 绩效 管理 上 升 到 国家 层面 ， 对 绩效 评价 提出 了 新 
的 要 求 。 当 前 阶段 ， 财 政绩 效 评价 由 传统 的 “审计 查 
账 ” 转 向 对 经 济 、 社 会 、 生 态 、 可 持续 影响 和 服务 对 
象 满意 度 等 多 种 因素 的 综合 考虑 ， 必 然 要 求 评价 方法 
的 创新 。 

自 财政 支出 绩效 评价 试点 开始 ， 到 全 面 预算 绩效 
管理 下 的 绩效 评价 ， 无 论 是 单位 自 评 、 部 门 评价 ， 还 
是 财政 评价 ， 都 普遍 采用 了 综合 打分 制 绩效 评价 的 方 
法 。 综 合 打 分 制 在 财政 绩效 评价 中 形成 了 一 种 思维 定 
式 与 固化 习惯 ， 即 使 该 方法 在 诸如 科技 、 教 育 等 领域 
并 不 十 分 合适 ， 但 管理 部 门 和 领域 专家 似乎 没有 找到 
可 以 替代 的 方法 。 例 如 ，2020 年 7 月 开展 的 国家 杰出 
青年 科学 基金 绩效 评价 ， 由 财政 部 预算 评审 中 心 组 织 
专家 和 第 三 方 机 构 开 展 绩效 评价 工作 ， 依 据 《 项 目 文 
出 绩效 评价 管理 办 法 》 的 要 求 对 决策 、 项 目 和 资金 管 
理 、 产 出 和 效益 指标 进行 细 化 和 分 值 设 定 ， 采 用 因素 
分 析 法 、 专 家 评分 法 和 公众 评价 法 进行 判断 ， 最 终 由 
专家 对 每 项 指标 进行 打分 ， 逐 级 加 权 求 和 得 出 其 总 分 
为 92 分 ,其 绩效 评价 等 级 为 “ 优 ””。 


2 财政 绩效 评价 综合 打分 制 方法 的 挑战 


2.1 财政 绩效 评价 综合 打分 制 方法 自身 的 局 限 

综合 打分 制 绩效 评价 方法 以 其 评价 体系 的 标准 
化 、 透 明 化 、 简 单 易 操作 等 特点 ， 对 于 快速 推进 绩效 
评价 实践 、 建 立 绩效 评价 制度 体系 、 深 化 绩效 评价 理 
念 起 到 了 重要 的 作用 。 然 而 ， 综 合 打分 制 绩效 评价 方 
法 的 局 限 性 也 不 容 忽视 ， 主 要 问题 有 5 个 方面 。 
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关于 财政 绩效 评价 综合 打分 制 方法 的 思考 


(1) 综合 打分 制 将 管理 绩效 与 产 出 绩效 等 多 维 指 
标 融 为 一 体 ， 难 以 体现 绩效 实质 。 综 合 打 分 制 将 管理 
绩效 与 产 出 绩效 等 多 维 指标 融 为 一 体 ， 采 取得 分 逐 项 
累加 的 方式 ， 形 成 单一 的 分 数 或 分 档 结 果 。 以 科研 项 
目的 预算 绩效 评价 为 例 ， 产 出 结果 突出 、 管 理 绩效 一 
般 的 项 目 与 产 出 绩效 一 般 、 管 理 能 力 突出 的 项 目 两 者 
很 可 能 出 现 绩效 评价 结果 分 数 一 致 的 情况 。 引 发 绩效 
评价 结果 掩盖 了 绩效 的 实质 与 问题 ， 偏 离 了 财政 绩效 
评价 的 目标 。 

(2) “一 刀 切 ”的 指标 体系 难以 体现 评价 对 象 的 
差异 性 ， 难 以 体现 绩效 实质 。 财 政绩 效 评价 的 对 象 特 
征 千差万别 ， 即 便 对 财政 科技 单项 投入 而 言 ， 也 存在 
基础 研究 、 应 用 研究 、 试 验 发 展 等 多 个 类 型 ， 绩 效 目 
标的 侧重 点 差异 显著 。“ 一 刀 切 ”的 指标 体系 ， 忽 上 略 
了 对 象 特征 的 差异 性 ， 难 以 体现 绩效 战略 目标 。 

(3) 综合 打分 制 方法 易于 出 现 评价 指标 标准 化 ， 
评价 尺度 差异 化 的 问题 。 综 合 打分 制 方法 受到 专家 主 
观 判断 、 评 分 尺度 差异 性 的 影响 ， 即 使 在 标准 化 的 指 
标 体 系 内 仍然 出 现 评价 尺度 差异 较 大 的 问题 。 而 且 ， 
最 终 以 分 数 或 分 档 呈 现 评价 结果 的 方式 ， 忽 略 了 评价 
结果 的 形成 过 程 ， 难 以 将 评价 对 象 的 关键 信息 或 问题 
揭示 出 来 。 

(4) 综合 打分 制 绩效 评价 方法 不 利于 建立 绩效 
管理 的 文化 和 和 氛围。 管理 者 将 注意 力 集中 在 如 何 提 
升 自身 在 既定 指标 体系 中 的 表现 ， 而 放弃 了 对 绩效 战 
略 目标 的 思考 及 对 绩效 管理 的 改进 ， 将 绩效 评价 演 
变 为 既定 指标 上 的 竞争 "， 偏 离 了 绩效 评价 “以 评 促 
改 ”“ 以 评 促 建 ”的 初衷。 

(5) 综合 打分 制 绩效 评价 的 组 织 需要 消耗 大 量 的 
人 、 财 、 物 等 资源 2。 综合 打分 制 绩效 评价 从 专家 送 
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选 、 项 目 评审 到 最 终 的 结果 审定 、 分 级 分 档 等 环节 都 
需要 大 量 的 人 力 、 物 力 投 入 ， 并 且 随 着 评价 对 象 数量 
的 增加 对 资源 的 消耗 呈 几 何 基数 增长 ， 给 评价 的 组 织 
方 造成 了 较 大 的 压力 。 

2.2 美国 废止 了 财政 绩效 评价 综合 打分 制 方法 PART 

在 财政 绩效 评价 中 采用 综合 打分 制 方法 是 国际 上 
开展 财政 绩效 评价 实践 初期 的 通用 做 法 。 美 国联 邦 政 
府 作为 政府 绩效 评价 实践 的 先行 者 ， 在 1993 年 通过 
《政府 绩效 与 结果 法 案 》 ( Government Performance 
and Results Act，GPRA ) 后 ， 于 2003 年 由 美国 总 统 预 
算 管 理 办 公 室 (OMB ) 开发 了 一 套 “ 项 目 评价 评级 工 
具 ” (Program Assessment Rating Tool，PART ) ， 用 以 
评价 联邦 政府 财政 支出 的 实施 绩效 。 

PART 以 综合 打分 制 为 核心 ， 建 立 了 通用 的 财政 
绩效 评价 框架 与 指标 体系 。GD 从 评价 指标 及 权重 设 
置 来 看 ， 评 价 指标 由 项 目的 目的 和 设计 、 战 略 计划 、 
项 目 管理 和 项 目 结果 4 个 一 级 指标 构成 。 其 中 ， 项 目 
结果 所 占 权重 最 高 ， 为 30%; 其 次 为 项 目的 目标 和 设 
计 、 项 目的 管理 ， 权 重 均 为 20%; 权重 最 低 的 为 项 
目的 战略 计划 ， 所 占 权 重 为 10%。PART 一 级 指标 下 
设 25 个 基本 问题 及 若干 附加 问题 。 其 中 ， 基 本 问题 
为 所 有 被 评 项 目的 通用 指标 ， 附 加 问题 则 是 基于 项 目 
类 型 差异 而 设置 的 个 性 化 指标 。 基 于 项 目 类 型 差异 ， 
PART 将 美国 联邦 政府 资助 的 项 目 分 为 直接 联邦 项 目 、 
竞争 性 联邦 项 目 、 稳 定 拨款 项 目 、 基 于 法 规 的 项 目 、 
资本 资产 和 服务 获取 项 目 、 信 用 项 目 及 人 研究 发 展 项 
目 7 个 类 型 ， 并 设置 若干 相应 的 附加 问题 。@) 从 评价 
流程 来 看 ,项 目的 主管 机 构 首 先 需要 以 “是 /不 是 ” 
回答 PART 指标 体系 中 的 问题 ， 并 提供 相应 的 证 据 和 
数据 支撑 ; 进而 ， 由 OMB 对 主管 机 构 的 回答 给 予 0 一 
100 分 的 评分 ; 而 后 ， 将 评分 转化 为 4 个 评价 等 级 ， 
包括 “有 效 ”( 85 一 100 分 ) 、“ 中 度 有 效 ”( 70 一 
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84 分 ) 、“ 勉 强 有 效 ” (50 一 69 分 ) 、 
(0 一 49 分 ) "。 

随 着 PART 不 断 推 进 与 实践 ， 其 问题 不 断 凸 显 ， 
于 2008 年 被 废止 。 实 施 初 期 ，PART 以 其 评价 体系 的 
标准 化 、 透 明 化 、 易 于 推行 等 特点 得 到 了 公众 与 管理 
层 的 认可 ， 这 对 于 快速 推动 GPRA 法 案 的 落地 ， 深 化 
政府 绩效 评价 的 理念 起 到 重要 的 作用 。 截 至 2007 年 ， 
PART 评价 方法 已 基本 覆盖 美国 联邦 政府 财政 支持 的 
所 有 项 目的 绩效 评价 工作 。 然 而 ， 随 着 实践 的 深入 ， 
PART 自身 指标 化 、 打 分 制 的 理念 受到 众多 质疑 ， 特 别 
是 “一 刀 切 ”的 评价 标准 忽略 了 评价 对 象 的 个 体 差异 
性 ， 评 价 结果 主观 性 过 强 、 评 价 成 本 过 高 等 问题 日 益 
凸显 。2008 年 ， 奥 巴 马 政府 上 台 后 ， 全 面 改革 政府 绩 
效 评价 的 理念 与 方法 体系 ， 废 除了 以 PART 为 核心 的 
综合 打分 制 绩效 评价 方法 ， 构 建 了 新 的 基于 证 据 的 绩 
效 评价 理念 与 方法 体系 。 

2.3 财政 绩效 评价 综合 打分 制 方法 的 问题 在 科技 领 

域 的 表现 尤为 突出 

财政 绩效 评价 综合 打分 制 方法 的 问题 在 不 同 领域 
的 表现 有 所 差异 。 在 产 出 易于 量化 、 易 于 横向 比较 的 
领域 ， 其 问题 并 不 突出 。 但 是 ， 对 于 产 出 难以 量化 、 
目标 难以 测度 和 横向 比较 的 科技 领域 ， 特 别 是 基础 研 
究 领 域 ,综合 打分 制 评价 方法 的 问题 较为 凸显 。 科 技 
活动 不 同 于 一 般 财政 资助 的 其 他 活动 ， 具 有 成 果 形 式 
的 多 样 性 、 效 果 影 响 的 延迟 性 、 投 入 产 出 的 不 确定 性 
等 特征 。 对 于 科技 活动 特别 是 前 端的 基础 科研 活动 能 
否 开 展 绩效 评价 ， 以 及 如 何 有 效 开 展 绩效 评价 一 直 是 
各 国 在 管理 实践 中 面临 的 突出 问题 。 

在 美国 的 实践 中 ，1993 年 美国 联邦 政府 出 台 
GPRA 法 案 之 时 ， 便 在 科技 界 、 政 策 界 引发 了 广泛 
的 关于 “基础 研究 投入 能 否 开 展 绩效 评价 ” ”的 争 
论 。2003 年 PART 方法 出 台 后 ， 对 于 其 在 科技 领域 


[3 无 效 99 


(@ OMB’s Program Assessment Rating Tool. [2002-07-01]/ [2020-09-15]. https://www.strategisys.com/omb_part. 
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是 否 适用 的 问题 ， 也 引发 了 讨论 ， 最 终 在 实践 中 为 
研究 发 展 项 目 设 立 了 单独 的 附加 问题 ， 且 在 对 美国 
国家 科学 基金 会 (NSF ) 的 绩效 评价 中 采用 了 “ 亮 
点 ” (highlights ) 评价 的 方式 ， 形 成 “50 项 亮点 
工作 ” ( Beauty 50s ) 作为 NSF 绩效 结果 的 佐证 。 
2008 年 PART 方法 废止 后 ， 由 美国 国立 卫生 研究 院 组 
织 学 术 界 、 政 策 研 究 界 、 政 府 部 门 共同 开展 了 关于 如 
何 开 发 新 的 研发 (R&D ) 投入 绩效 评价 方案 和 模型 以 
提高 科学 管理 能 力 的 研讨 会 ， 探 讨 美国 联邦 政府 财政 
科技 绩效 评价 的 新 方法 ”。 

在 我 国 ， 虽然 从 2000 年 起 便 在 财政 绩效 评价 中 采 
用 了 综合 打分 制 的 评价 方法 ,但 是 在 2010 年 国家 自然 
科学 基金 成 立 25 周年 的 绩效 评价 之 时 ， 在 深入 探讨 
“如 何 开 展 政府 基础 研究 投入 绩效 评价 ”问题 的 基础 
上 ， 并 未 采用 综合 打分 制 的 绩效 评价 方法 ， 而 是 选择 
采取 “机 构 自 评 + 国 际 同 行 评议 ”的 方法 ， 以 找 亮 点 
工作 和 关键 问题 及 其 证 据 为 抓 手 ， 开 展 基础 研究 领域 
的 财政 绩效 评价 。 


3 改革 财政 绩效 评价 综合 打分 制 方法 的 思路 


那么 ， 针 对 财政 绩效 评价 综合 打分 制 方法 中 存在 
的 问题 ， 特 别 是 财政 绩效 评价 综合 打分 制 在 科技 领域 
面临 挑战 的 问题 ， 如 何 寻 求解 决 思路 ?基于 对 问题 的 
分 析 及 对 国际 实践 的 梳理 ,我 们 认为 可 从 3 个 方面 着 
Bs 

(1) 理念 上 更 加 强调 绩效 评价 的 方法 应 服务 于 绩 
效 管理 的 战略 目标 。 绩 效 管理 是 由 绩效 目标 与 计划 、 
绩效 监督 与 评价 、 绩 效 结果 与 反馈 所 构成 的 闭环 中， 
绩效 评价 只 是 上 述 闭 环 中 的 一 个 环节 。 绩 效 评价 方法 
的 选择 不 仅 要 兼顾 科学 性 、 合 理性 和 可 操作 性 ， 更 要 
服务 于 绩效 管理 的 战略 目标 ， 并 随 着 绩效 管理 进入 
不 同 阶 段 而 动态 调整 。 随 着 绩效 管理 的 不 断 推进 ， 提 
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关于 财政 绩效 评价 综合 打分 制 方法 的 思考 


升 绩效 评价 质量 ， 服 务 于 绩效 管理 的 战略 目标 ， 成 
为 绩效 管理 改革 的 新 理念 。 例 如 ， 美 国联 邦 政府 对 
政府 绩效 评价 纲领 性 文件 《政府 绩效 与 结果 法 案 》 
( GPRA ) 的 修订 ， 就 突出 体现 了 这 一 理念 的 转变 。 
2011 年 ， 奥 巴 马 总 统 签署 通过 了 《政府 绩效 与 结果 法 
案 2010 修正 案 》 ( GPRAMA ) 作为 GPRA 的 修正 条 
款 ， 以 保证 GPRA 的 长 期 影响 力 。GPRAMA 的 修订 重 
点 体现 在 : (D 突出 绩效 目标 在 绩效 评价 与 管理 中 的 作 
用 。 绩 效 目 标的 设置 是 开展 绩效 评价 与 管理 的 基础 与 
方向 ， 绩 效 评价 方法 的 选择 ， 同 时 也 应 服务 于 绩效 目 
标 。@) 强化 绩效 评价 结果 的 应 用 ， 明 确 规范 未 达成 绩 
效 目标 的 整改 措施 ， 以 保证 绩效 评价 “以 评 促 改 ” 作 
用 的 切实 发 挥 。@) 完善 政府 绩效 评价 的 管理 框架 ,更 
有 效 地 指导 政府 绩效 评价 工作 的 展开 。GPRAMA 改革 
了 原 有 综合 打分 制 的 绩效 评价 方法 体系 ， 将 绩效 评价 
方法 回归 服务 绩效 评价 目标 的 定位 ， 实 现 以 方法 服务 
于 使 命 的 目标 。GPRAMA 的 核心 在 于 绩效 评价 重点 聚 
焦 战略 性 目标 的 评价 ， 而 不 是 过 去 PART 方法 面 面 俱 
到 的 分 点 累积 。 

(2) 借鉴 基于 证 据 的 绩效 评价 等 新 方法 ， 构 建 满 
足 财政 绩效 评价 管理 需求 的 新 的 方法 体系 。 示 来 在 新 
的 绩效 评价 方法 体系 中 应 通过 收集 大 量 的 数据 、 事 实 
证 据 ， 以 “基于 证 据 + 专 家 研判 ”的 方法 来 评价 绩效 
目标 的 达成 情况 ， 并 强调 基于 绩效 评价 结果 的 管理 改 
进 。 新 的 方法 体系 适用 于 机 构 、 计 划 、 项 目 等 不 同 对 
象 的 绩效 评价 。 在 机 构 绩效 评价 中 ， 采 取 高 优先 级 绩 
效 目标 评价 的 方法 : @ 基于 对 机 构 自 身 使 命定 位 的 认 
识 与 理解 ， 结 合 国家 需求 在 5 年 期 规划 中 制定 3 一 8 项 
机 构 层 面 的 高 优先 级 绩效 目标 ， 并 提出 实施 方案 。 实 
施 方案 中 包括 高 优先 级 绩效 目标 的 责任 人 及 对 高 优先 
级 绩效 目标 的 年 度 分 解 方案 。C@) 在 绩效 评价 中 ， 提 出 
可 靠 的 绩效 测度 标准 与 指标 ， 定 期 采集 评价 所 需 的 数 


(©) Science of Science Management. [2008-10-01]. https://dpepsi.nih.gov/oepr/science management. 
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专题 : 科技 评价 一 一 实践 与 展望 


据 ， 开 展 基 于 数据 与 事实 的 绩效 评价 。 在 测度 标准 与 
指标 的 选择 中 ， 首 先 考 虑 是 否 存在 成 熟 可 靠 的 做 法 。 
如 果 存 在 ， 则 验证 该 方法 在 本 绩效 评价 中 的 可 重复 
性 ; 如 果 没 有 现成 的 方法 ， 则 需要 考虑 试验 、 开 发 新 
的 方法 。 上 述 做 法 是 为 了 寻求 行 之 有 效 的、 适合 绩效 
目标 的 方法 体系 (图 1 ) 。@ 通过 评价 结果 公开 的 方 
式 接受 全 社会 的 监督 。 项 目 层 面 的 绩效 评价 则 成 为 机 
构 层 面 开 展 高 优先 级 绩效 目标 评价 的 基础 ， 为 机 构 层 
面 的 绩效 评价 提供 数据 与 事实 。 

以 NSF 的 绩效 评价 为 例 ，2018 一 2022 年 度 ， 


设置 高 优先 选择 基于 证 据 的 个 性 化 定期 采 结果 
级 绩效 目标 的 测度 标准 与 指标 集 数据 “” 公 


| 


现 有 实践 中 是 否 有 成 熟 可 靠 的 做 法 


发 展 、 试 验 验证 可 复制 性 


-一 


寻求 行 之 有 效 的 做 法 
e 现成 的 方法 
e 探索 更 多 的 绩效 分 析 方法 


图 1 基于 证 据 的 绩效 评价 方法 流程 
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NSF 共 提 出 3 项 机 构 高 优先 级 绩效 目标 ( 表 1) 。 其 
中 ，2019 年 度 ， 支 撑 高 优先 级 绩效 目标 评价 的 基础 数 
据 和 证 据 均 来 自 于 NSF 项 目 绩效 管理 的 《科研 绩效 
阶段 报告 》 ( Research Performance Progress Reports, 
RPPR ) 。PRRP 代 替 了 原 有 的 项 目 报告 ,采取 临时 报 
告 、 年 度 报告 、 终 期 报告 的 方式 描述 科研 项 目的 组 
织 、 成 果 、 进 展 、 影 响 力 、 经 费 等 信息 ”。 新 的 绩效 
评价 方法 体系 以 服务 于 绩效 目标 、 改 进 绩效 管理 为 目 
的 ， 基 于 项 目 特点 选取 事实 证 据 ， 采用 多 方 专家 研判 
的 方式 ， 判 断 绩效 目标 的 完成 情况 并 提出 管理 改进 建 
议 。 


(3) 在 财政 绩效 评价 综合 打分 制 问题 凸显 的 科 
技 领域 ， 可 多 采用 科技 评价 实践 中 已 经 形成 的 好 方 
法 。 科 技 评价 经 过 多 年 的 实践 与 探索 ， 形 成 了 丰富 的 
理论 体系 与 实践 经 验 。 例 如 ， 当 前 中 国 科学 院 研 究 所 
评价 所 采用 的 以 同行 评议 为 核心 的 重大 产 出 导向 评价 
体系 ， 通 过 “两 个 环节 、 一 个 基础 ”， 对 人 研究 所 进行 
全 面 诊断 中 。 这 是 中 国 科 学 院 在 借鉴 和 比照 国际 经 验 
的 基础 上 ， 结 合 自 身 特点 与 发 展 规律 ， 提 出 的 新 型 同 
行 评议 模式 ， 其 特点 是 重 在 诊断 ， 借 助 同 行 专家 的 
力量 帮助 研究 所 发 现 问 题 、 把 握 方向 、 改 善 管理 ， 
提高 实现 重大 成 果 产 出 的 效率 ; 该 模式 采用 了 和 美 


表 1 美国 国家 科学 基金 会 2018 一 2022 年 度 高 优先 级 绩效 目标 


战略 愿景 


高 优先 级 绩效 目标 


在 科学 、 工 程 和 研究 知识 
等 领域 提升 知识 水 平 实践 


> 信号 


提升 国家 解决 现 有 及 社会 影响 
未 来 挑战 的 能 力 


STEM (科学 、 技 术 、 工 程 、 数 学 ) 劳动 力 
人 力 资源 


提升 NSF 绩 效 表现 
过 程 及 运行 


通过 对 于 想法 、 人 员 和 基础 设施 的 投资 提升 知识 水 平 


住 进 研 究 实 践 


支持 科学 研究 、 促 进 合作 关系 ， 以 加 速 创新 进程 ， 并 为 国家 提供 
解决 重大 社会 需求 的 能 力 


佳 动 更 强大 、 更 多 元 的 研究 队伍 的 发 展 ， 提 升 国家 科学 创新 能 力 
豚 引 、 留 住 多 元 骨干 人 才 ， 并 充分 发 挥 人 才 作 用 


寺 续 性 提升 机 构 运营 能 力 


资料 来 源 : FY 2019 annual performance report and FY 2021 annual performance plan. https://nsf.gov/about/budget/fy2021/pdf/68_fy2021.pdf. 


(© National Institutes of Health. Research Performance Progress Report. [2019-03-06]. https://grants.nih.gov/grants/rppr/index.htm. 
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国 GPRAMA 中 高 优先 级 目标 评价 相似 的 一 种 方法 。 在 
机 构 评 价 这 一 复杂 的 问题 体系 中 ， 选 取 其 最 为 关键 的 
定位 、 少 数 的 重大 产 出 和 重点 培育 方向 ， 作 为 评价 的 
重点 ， 而 且 是 分 项 评价 。 将 人 才 培 养 、 资 金管 理 、 管 
理 创新 等 作为 辅助 评价 的 维度 ， 以 突出 研究 所 评价 的 
重点 与 核心 >。 可 见 ， 科 技 评价 中 积累 的 方法 体系 已 
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化 了 对 评价 方法 表面 形式 化 、 合 理性 的 需求 ， 而 是 强 
调 评价 方法 能 够 体现 绩效 实质 ， 进 而 有 助 于 促进 基于 
绩效 结果 的 管理 改进 。 综 合 打分 制 绩效 评价 方法 以 多 
维 绩效 指标 、 逐 项 累加 形成 单一 结论 的 方式 ,模糊 了 
绩效 的 战略 目标 、 难 以 体现 绩效 实质 。 该 方法 在 科技 
领域 的 应 用 ， 问 题 尤其 突出 。 由 于 科技 活动 自身 过 程 


经 为 财政 绩效 评价 提供 了 丰富 的 方法 库 和 案例 库 ， 可 
结合 财政 绩效 评价 的 需求 ， 合 理 选择 绩效 评价 方法 ， 
构建 满足 新 时 代 财 政绩 效 评价 管理 需求 的 绩效 评价 方 
法 体系 。 


4 结语 


我 国 自 2000 年 试点 开展 财政 支出 绩效 评价 以 来 ， 
经 历 20 年 的 实践 , 已 基本 建立 了 财政 绩效 评价 制度 体 
系 与 方法 框架 ，“ 花 钱 必 问 效 ， 无 效 必 问 责 ”的 理念 
深入 人 心 。 新 的 政治 、 经 济 及 社会 形势 ， 对 改革 绩效 
评价 方法 ， 提 高 绩效 评价 质量 提出 了 新 的 要 求 。 基 于 
对 打分 制 绩效 评价 方法 的 概念 与 应 用 、 问 题 与 挑战 及 
新 的 理念 与 方法 的 分 析 ， 作 出 以 下 判断 。 

(1) 财政 绩效 评价 综合 打分 制 方法 难以 满足 财政 
绩效 评价 高 质量 发 展 的 需求 。 综 合 打分 制 绩 效 评价 方 
法 以 其 标准 化 、 透 明 化 、 简 单 易 操 作 的 特点 ， 对 快速 
推动 绩效 评价 工作 ， 深 化 绩效 评价 理念 起 到 了 重要 的 
作用 。 我 国 经 过 20 年 的 绩效 评价 管理 实践 ,已 基本 建 
立 起 财政 绩效 评价 体系 ， 积 累 了 较为 丰富 的 财政 绩效 
评价 实践 ， 基 本 实现 了 财政 绩效 评价 的 “全 歼 盖 ”， 
已 由 绩效 管理 的 全 面 推 进 阶段 进入 高 质量 发 展 阶段 。 
高 质量 绩效 管理 对 绩效 评价 方法 提出 了 更 高 要 求 ， 综 
合 打 分 制 绩效 评价 方法 已 完成 其 历史 使 命 ， 新 时 代 嗓 
待 构建 新 的 方法 体系 。 

(2) 财政 绩效 评价 综合 打分 制 方法 特别 是 难以 体 
现 科技 财政 绩效 评价 的 特点 。 高 质量 绩效 管理 阶段 弱 


复杂 、 产 出 不 确定 性 强 ， 导 致 科技 绩效 具有 目标 不 确 
定性 、 绩 效 标准 不 可 量化 等 特点 。 因 此 ， 形 式 化 、 结 
构 化 的 综合 打分 制 绩效 评价 方法 尤其 不 适应 科技 财政 
绩效 评价 的 需求 。 

(3) 应 注重 “基于 证 据 的 绩效 评价 方法 ”和 
高 优先 绩效 目标 评价 方法 在 绩效 评价 中 的 应 用 。 美 
国联 邦 政府 以 “基于 证 据 的 绩效 评价 方法 ”取代 了 
以 PART 为 代表 的 综合 打分 制 绩效 评价 方法 。 我 国 在 
新 时 代 财 政绩 效 评价 体系 改革 中 可 借鉴 “基于 证 据 的 
绩效 评价 ”理念 ， 构 建 “ 基 于 证 据 + 专家 研判 ”的 绩 
效 评价 方法 体系 ,评价 财政 绩效 战略 目标 的 达成 情 
况 。 对 于 参与 绩效 评价 的 专家 ,采取 专家 库 的 管理 
模式 ， 改 变 目 前 一 次 性 评价 所 带 来 的 问题 ， 构 建 跟踪 
式 、 负 责任 的 专家 研判 体系 。 有 效 发 挥 第 三 方 机 构 在 
绩效 评价 中 专业 化 的 职能 ， 采 取 “ 准 入 资质 ”管理 模 
式 ， 全 面 提升 绩效 评价 方法 体系 的 质量 。 同 时 ， 美 
国 GPRAMA 中 高 优先 级 目标 评价 实践 和 中 国 科学 院 
以 “一 三 五 ”目标 评价 为 特征 的 重大 产 出 导向 评价 体 
系 ， 都 是 高 优先 级 目标 评价 方法 的 成 功 案例 ， 值 得 借 
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Abstract Having practiced for more than 20 years, China has basically established the framework of fiscal performance evaluation 
system and method. As one of the majorly applied fiscal performance evaluation methods in China, Comprehensive Scoring Method 
(CSM) has played a critical role in the rapid promotion of performance evaluation practice due to its standardization, transparency, 
and operability. However, CSM is also challenged by certain problems, such as multi-dimensional hybrid evaluation, progress-focused 
evaluation, and poor reflection of the actual performance, and even it faced with severer challenges for its application in science and 
technology field. Based on the aforementioned problems, this study aims to systemically analyze the issues and disputes of CSM, and to 
bring up new options and ideas in the CSM reform based on the new demands of state full promotion of budget performance evaluation 
in the new era and related international practices. 


Keywords fiscal performance evaluation, comprehensive scoring method (CSM), thoughts 


阿 儒 涵 。 中 国 科 学 院 科 技 战 略 咨 询 研 究 院 副 研究 员 ， 中 国 科学 院 青年 创新 促进 会 会 员 。 
主要 研究 领域 为 政府 科研 经 费 配 置 与 管理 。 承 担 来 自 财政 部 、 中 国 科学 院 、 国 家 自然 科 
学 基金 委员 会 的 多 项 决策 支撑 项 目 ， 研 究 成 果 多 次 支撑 国家 科研 经 费 管 理 改革 政策 的 制 

定 。 承 担 国家 自然 科学 基金 青年 科学 基金 项 目 、 面 上 项 目 等 多 项 研究 项 目 ， 在 国内 重要 
期 刊 发 表 学 术 论 文 近 20 篇 。E-mail: arh@casisd.cn 


Aruhan Associate Researcher of Institutes of Science and Development, Chinese Academy of Sciences 


(CASISD), Member of the Youth Innovation Promotion Association of Chinese Academy of Sciences 
(CAS). Her research interest focuses on the allocation and management of government scientific research funds. Dr Aruhan undertook 
anumber of decision support projects from the Ministry of Finance, CAS, and the National Natural Science Foundation of China (NSFC). 


The research results have repeatedly supported the reform policy making of national research funding management. Dr. Aruhan also 


*Corresponding author 


1446|2020 年 .第 35 卷 .第 12 其 


刊 


202303.08895v1 


chinaXiv 


ChinaXiv 合 作 期 刊 


关于 财政 绩效 评价 综合 打分 制 方法 的 思考 


undertook a number of research projects such as the young scientists fund project, general project from NSFC, etc., and has published 


nearly 20 academic papers in important domestic journals. E-mail: arh(@casisd.cn 


程 燕 林 中 国 科学 院 科技 战略 咨询 研究 院 助 理 研究 员 。 主 要 研究 领域 为 科技 评价 与 科技 
成 果 转 化 。 承 担 来 自 国家 发 展 和 改革 委员 会 、 农 业 农 村 部 、 中 国 科学 院 及 地 方 政府 的 咨 
询 项 目 ， 多 项 研究 成 果 为 部 门 决 策 起 到 了 支撑 作用 ; 同时 开展 科技 评价 和 科技 成 果 转 化 
的 相关 理论 研究 。 在 国内 核心 期 刊 发 表 学 术 成 果 10 余 篇 。E-mail: chengyanlin@casisd.cn 


CHENG Yanlin Assistant Research Fellow of Institutes of Science and Development, Chinese Academy 


of Sciences (CAS). Her research interest focuses on R&D evaluation and transformation of scientific and 


technological achievements. Dr. Cheng has undertaken consulting projects from National Development and 
Reform Commission, Ministry of Agriculture and Rural Affairs, CAS, and local governments, with many research results supporting the 
decision-making of the departments. At the same time, she has carried out theoretical research on R&D evaluation and transformation 
of S&T achievements, and has published more than 10 academic achievements in domestic core journals. 


E-mail: chengyanlin(@Ocasisd.cn 


国 责 任 编 辑 : 起 一 男 


图 和 用 科学 尝 院 刊 |1447 


